Q-learning 相关硕士博士期刊学术论文

Q-learning相关论文

能量收集辅助的矿山物联网智能计算卸载方法

针对计算、能量和内存资源受限的矿山物联网设备和大量时延敏感型计算任务需求的智慧矿山场景，该文提出一种能量收集（EH）辅助的矿山物......

期刊

矿山物联网移动边缘计算能量收集 Q-learning 深度确定性策略梯度（DDPG）

无人机辅助物理层安全下的保密性能优化

信息安全是影响物联网（IoT）应用的关键因素之一，物理层安全是解决物联网信息通信安全问题的有效技术。该文针对物联网中带有主动攻击......

期刊

物理层安全人工噪声 Q-learning 可达安全速率无人机轨迹优化

风场中平流层飞艇轨迹智能控制方法

平流层飞艇具有区域驻留持久稳定、载荷能力强、平台位置优越等优势,是极佳的观测侦查平台,应用潜力巨大,是当前临近空间领域的主......

学位

平流层飞艇轨迹跟踪控制神经网络强化学习 Q-learning

基于强化学习的四足机器人路径规划研究

近些年来,随着无人智能装备技术的发展,在生活中出现了不同类型的机器人,它们的功能和形态都有所不同,如在危险环境的搜索机器人,......

学位

强化学习 SLAM 路径规划粒子群算法 Q-Learning DWA ROS操作系统

基于马尔可夫的多功能雷达认知干扰决策建模研究

多功能雷达是现代电磁战场上不可或缺的重要装备，针对多功能雷达的干扰一直是一个难题。本文在研究多功能雷达信号特点和雷达对抗过......

期刊

雷达对抗马尔可夫决策过程雷达状态强化学习 Q-Learning

基于强化学习的兵棋决策方法研究

兵棋推演是一种较为复杂的博弈对抗过程,是支持复杂对抗方案决策优化的重要手段。传统的基于兵棋推演的决策分析主要限于使用规则......

学位

兵棋推演智能决策强化学习 Q-Learning Actor-Critic框架

基于强化学习的雷达干扰资源调度建模研究

在对远程支援干扰飞机雷达干扰资源调度问题具体分析的基础上,基于雷达对抗推演仿真平台,将组网雷达干扰资源调度问题建模为一个带......

会议

雷达干扰资源调度马尔可夫决策过程干扰决策模型 Q-Learning

应用改进Q-learning算法解决柔性作业车间调度问题

柔性作业车间调度是目前加工系统中的一个重要调度问题，对于该问题的解决方法大都存在速度较慢等缺陷，提出一种改进的Q-learning算法......

期刊

Q-learning 柔性作业车间调度

基于强化学习的BPPV治疗辅助决策优化方法与系统

良性阵发性位置性眩晕（Benign Paroxysmal Positional Vertigo,BPPV）是一种临床常见会导致眩晕的疾病,对其进行精准有效的治疗具有重......

学位

BPPV 耳石复位操作 Q-learning Sarsa

基于强化学习的移动机器人协同控制策略研究

随着自动化技术的不断发展,车间物料运输系统不断向着智能化的方向发展,而工业AGV作为一种新型的物料运输设备,因其具有较高的柔性......

学位

自动导引车 BP网络 PID轨迹跟踪 Q-learning 行为式编队

动态环境下的自动导引运输车路径规划问题

本论文主要研究动态环境下自动导引运输车（AGV）的路径规划问题,其中包括移动障碍物环境下的多AGV路径规划问题,以及在规划后AGV的实......

学位

路径规划移动障碍 A*算法强化学习 Q-learning

矢量解耦下的五轴数控系统路径平滑算法

为保证五轴机床加工过程平滑稳定,提出一种矢量解耦下的五轴数控系统路径平滑算法.五轴数控系统加工路径通过对一系列离散控制点连......

期刊

路径平滑矢量解耦 Q-Learning 离散积分

基于强化学习的AGV动态路径规划研究

传统的自动规划小车（Automated Guided Vehicles,AGV）路径规划需要提供详细的场景地图,不适应复杂的动态环境,从而导致工作效率低,易......

学位

AGV 强化学习 Q-learning Kohonen 模拟退火算法

考虑多技能人员学习效应的项目调度问题及优化方法研究

随着科学技术和市场经济的发展,在激烈竞争的市场环境下,企业面临的压力、风险越来越大,产品研发愈加受到企业的重视。针对产品研......

学位

项目调度多技能人员学习效应启发式算法 Q-learning

线性切换系统事件触发与无模型控制研究

切换系统是混杂系统中的一种典型代表,切换系统由一系列被微分方程和差分方程描述的子系统和一个决定这些子系统切换的切换信号组......

学位

切换系统动态事件触发 H<sub>∞</sub>控制 Q-learning 强化学习

基于冲突热点的航空器场面滑行路径优化算法

近年来,随着国内民用航空事业的飞速发展,航空器在多跑道机场场面滑行的过程中频繁发生冲突碰撞及跑道入侵等事件,从而导致进离港......

学位

冲突热点路径规划 Q-learning A*算法

基于马尔科夫的多功能雷达认知干扰决策建模研究

多功能雷达是现代电磁战场上不可或缺的重要装备，针对多功能雷达的干扰一直是一个难题。本文在研究多功能雷达信号特点和雷达对抗过......

期刊

雷达对抗马尔科夫决策过程雷达状态强化学习 Q-Learning

基于药事服务资源协同认知的调度模型研究

“互联网+健康”模式的兴起以及移动物联网、云计算、大数据、5G等信息技术与医药行业的深度融合加快医药行业的发展进程,药事服务......

学位

药事服务协同认知双边匹配 Gale-Shapley Q-learning

基于逐次超松弛技术的Double Speedy Q-Learning算法

Q-Learning是目前一种主流的强化学习算法,但其在随机环境中收敛速度不佳,之前的研究针对Speedy Q-Learning存在的过估计问题进行......

期刊

强化学习 Q-Learning 马尔可夫决策过程逐次超松弛迭代法自循环结构

基于无线携能传输和多级边缘卸载的空地协作巡检算法

变电站采用智能机器人和无人机可实现高效、自动设备巡检。地面机器人在地上和室内近距离巡检方面具有优势；无人机更加灵活，巡检范围......

期刊

智能巡检移动边缘计算无线携能传输 Q-Learning 资源优化

室内移动机器人位姿估计与避障方法研究

室内移动机器人具有广泛的运用,在提升生产效率的同时还能降低人力成本。通过多种输入的传感器信息,机器人可以在具有先验信息或不......

学位

室内移动机器人位姿估计避障 Q-learning 视觉里程计

基于openAI Gym和DRL的移动机器人路径规划算法研究

移动机器人路径规划技术,即在给定的起始点和目标点之间找到一条符合约束条件的有效路径（约束条件可以是无碰撞、路径最短、耗能低......

学位

移动机器人路径规划 Q-learning 深度强化学习算法

车联网通信切换机制研究

在这个万物互联的时代,车辆成为第三大联网设备,车联网技术受到学术界和工业界广泛关注。车联网以信息通信技术为核心,集成了通信......

学位

车联网通信垂直切换强化学习 Q-Learning UCB

基于LTE-M的CBTC车地通信系统弹性优化研究

随着无线通信技术的不断发展,城市轨道交通业务的逐步拓宽,面向城市轨道交通业务需求的长期演进通信技术（Long Term Evolution for ......

学位

LTE-M 车地通信系统弹性半马尔科夫决策过程 Q-learning

基于无人机增强的车联网网络覆盖机制研究

随着5G通信技术的不断发展,各商用进程的加快,车联网（Vehicle Ad-hoc Network,VANET）作为5G通信的重要应用场景,其相关研究得到学术......

学位

车联网覆盖增强动态优化 Q-learning

无线自组织网路中基于强化学习的路由机制研究

随着智能移动终端的普及以及网络基础建设的完善,无线自组织网络的应用越来越广泛。车联网（Vehicular Ad Hoc Network,VANET）和水下......

学位

无线自组织网 VANET UWSNs Q-learning 路由机制

基于信息共享的多智能体自主电子干扰系统

为了实现电子干扰机在复杂电磁环境中对辐射源的有效干扰，利用多智能体电子干扰机与信息共享机制，突破原有单传感器的有限信息感知能......

期刊

信息共享多智能体电子干扰机 Q-Learning 态势感知

基于Q-Learning的高速列车动态调度方法

高速铁路作为国家综合交通运输体系的骨干核心,近十年来取得了飞速蓬勃的发展。其飞速发展的同时也引发了路网复杂化、分布区域广......

会议

高铁动态调度强化学习 Q-Learning

基于强化学习的多小区NOMA上行功率控制方案研究

非正交多址接入(Non-Orthogonal Multiple Access,NOMA)是解决未来大规模接入场景的潜在技术,在多小区NOMA系统中干扰情况变得异常......

期刊

非正交多址接入部分功率控制 Q-LEARNING 上行链路

强化学习在多阶段装备组合规划问题中的应用

针对多阶段武器装备组合规划中的选择难、规划难问题,提出基于多目标优化算法以及强化学习技术的混合优化方法。在各个阶段以装备......

期刊

武器装备组合规划非支配排序遗传算法强化学习 Q-LEARNING

认知无线电网络的累加干扰分析

随着信息时代的到来,各种无线通信技术的发展日新月异,可用的无线频谱资源正面临逐渐枯竭的困境。认知无线电(Cognitive Radio, CR......

学位

认知无线电机会频谱接入累加干扰概率统计模型马尔科夫决策过程 Q-Learning算法

基于Q-learning的动态频谱接入算法研究

随着无线通信技术的高速发展,终端及通信业务的的急剧增长。泛在通信的普及,频谱资源需求与稀缺的矛盾日益严重。认知无线电为频谱......

学位

动态频谱接入 Q-learning 信道选择吞吐量冲突概率

异构无线网络中基于Q-learning的资源分配策略研究

随着femtocell的大量部署,femtocell与macrocell形成的异构网络遭受的干扰复杂多变,用户对网络的QoS要求也越来越高,因此,抑制femt......

学位

femtocell QoS保障 Q-learning 子信道分配功率控制

基于Q-Learning的无线传感器网络安全路由策略

无线传感器网络由于其自身的局限性,使得它容易遭受各种安全威胁。大部分研究工作只针对特定类型的攻击,且很多工作在提升无线传感......

学位

安全路由 Q-Learning 路由策略无线传感器网络

基于栅格细胞的高维空间函数拟合算法研究

哺乳动物能够将它们所处的环境在大脑内部表示出来。位于海马体中的位置细胞只对环境中的某几个位置放电。位于内嗅皮层的栅格细胞......

学位

栅格细胞径向基函数函数拟合随机映射 Q-Learning

基于机器学习的OFDM波形参数决策方法研究

波形参数决策作为认知通信及智能通信的核心部分,可以看作是自适应调制编码(Adaptive Modulation and Coding,AMC)等技术的进一步......

学位

认知无线电智能决策 OFDM系统强化学习 Q-learning

基于增强学习的充电站选择策略研究

近年来,由于石油价格的不断攀升以及汽车排放污染物带来的严重环保问题,使得节能减排成为全球的新课题,为电动汽车发展迎来了最佳......

学位

电动汽车实时充电 Dijkstra Q-learning SARSA DQN

移动机器人多机探索与路径规划算法研究

随着人工智能领域的崛起,机器人研究的不断深入,智能机器人逐渐开始融入人们的日常生活。同时,消费者对智能机器人高效率、高质量......

学位

多机探索路径规划 RRT-BFS Q-Learning ROS

物理层安全约束下的NOMA系统资源分配算法研究

非正交多址接入(Non-Orthogonal Multiple Access,NOMA)技术通过功率域信号复用可有效提高无线通信系统的频谱资源利用率。无线物......

学位

非正交多址接入物理层安全资源分配深度学习 Q-learning

基于强化学习的云提供商资源划分策略研究

云计算产业在全球范围飞速发展,吸引越来越多的企业及个人用户将其业务转移到云市场。在云计算中,云用户的需求有不同特性,部分用......

学位

云计算资源划分策略 Q-learning 马尔科夫博弈 Minimax-Q

基于免模型强化学习的自适应Agent协作规划

面向智能体协作的自适应系统(Multi-Agent Collaboration System,MACS)的设计目的是使得Agent能够实时的响应环境的变化,有效的组......

学位

Agent协作 JaCaMo Q-learning 任务分配角色

基于强化学习的四旋翼自主导航方法研究

近年来,随着四旋翼无人机(简称四旋翼)在航拍、资源勘探、农作物保护等领域的广泛应用,业界对其控制性能和智能化程度的要求也越来......

学位

四旋翼无人机强化学习 Q-Learning 策略梯度自主导航

面向物联网的数据通信软件设计与休眠算法的研究

随着科学技术的大力开展,关于物联网的应用在日常生活中随处可见,与物联网相关的技术也在不断更新发展中,并出现了低带宽、远距离......

学位

物联网软件系统 Q-Learning 自适应占空比

基于Q-learning的个性化产品供应链Multi-Agent多边协商研究

随着消费需求的转变,个性化产品越来越受到消费者的偏爱。互联网、信息技术和生产制造能力的提升,为个性化产品的生产提供了技术基......

学位

个性化产品供应链 Q-learning Multi-Agent 模糊理论协商

基于动态规划和强化学习的无人机路径规划算法研究

无人机路径规划问题是当下的研究热点之一,现有的硬件条件和人工智能理论的飞速进步,使得单体无人机智能化程度大大提高,实现了从......

学位

运动状态空间层次式地图网格化方法计算复杂度动态规划强化学习 Q-learning 环境适应性

云内容分发网络内容放置优化方法研究

随着云计算的发展,基于云的内容分发网络应运而生。云内容分发网络(Cloud based Content Delivery Networks,CCDNs)通过部署低成本......

学位

云内容分发网络能耗优化多播路由 Q-learning 拥塞成本

基于CAS理论的复杂工程社会风险形成与演化研究

随着经济的飞速发展、科技水平的日渐进步以及城镇化水平的不断提升,大量重大基础设施等复杂工程随之出现。复杂性是复杂工程的重......

学位

复杂工程复杂性社会风险复杂适应系统理论 Q-learning

基于移动群智感知的工作流调度技术研究

工作流调度问题一直是工作流领域中的难点和研究热点。一个高效的工作流调度算法,能很大程度上提高和改善应用的服务质量。工作流......

学位

移动群智感知工作流任务调度 Q-learning 多目标优化

基于强化学习的全双工小基站网络自优化研究

随着通信网络的发展,基站小型化已成为未来重要发展趋势。在单层蜂窝网络中引入小基站,能够提高网络的通信容量,扩大基站覆盖范围......

学位

Kuhn-Munkres Q-learning 信道选择干扰调节自优化小基站网络

基于增强学习的虚拟机服务迁移的关键技术研究及应用

作为新一代分布式计算的基础设施,云计算平台由于其在性能和价格上相对于传统平台的优势,已经成为近些年学术界和工业界研究的一个......

学位

云计算动态服务迁移增强学习 Q-learning

看过本文同时还关注